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W ostatnim okresie w literaturze pojawilo sig mnóstwo praca dotycza- 
cych róznych etapów budowy modelu ekonometrycznego. Szczególnie duzo 
miejsca poswieca sie tematowi doboru zmiennych objasniajacych do mo- 
delu ekonometrycznego, tj. jednemu z ważniejszych problemów prawidłowej 
konstrukcji modelu. Stosowane obecnie metody doboru zmiennych można 
podzielić na trzy grupy: metody statystyczne, taksonomiczne oraz oparte 
na analizie czynnikowej!. We wszystkich tych metodach preferuje się te 
zmienne, które są silnie skorelowane ze zmienną endogeniczną a słabo skore- 
lowane między sobą. W pracy Z. Hellwig [9] wykazał na przykładzie prostego 
modelu, że maksymalizacja współczynników korelacji zmiennych objaśnia- 
jących ze zmienną endogeniczną i minimalizacja współczynników korelacji 
między zmiannymi objaśniającymi daje w efekcie zmieniejszenie wariancji 
resztowej oraz zmniejszanie elementów macierzy wariancji i kowariancji es- 
tymatorów paramterów modelu. To zaś jest decydującym czynnikiem wpły- 
wającym na poprawność danego modelu, czyli w efekcie na jego praktyczną 
przydatność. 

B. Guzik [6] przedstawil metodę doboru zmiennych do jednorównanio- 
wego liniowego modelu ekonometrycznego wykorzystującą zmodyfikowany 
wspólczynnik determinacji 


G = r” det R, 


1 Do ważniejszych prac opisujących poszczególne grupy metod należą: — dla pierwszej 
grupy [2], [3], [4], [6], [8] — dla drugiej grupy [1], [5], [10], [12] — dla trzeciej grupy [7], [11]. 
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edzie r? oznacza kwadrat wspólczynnika korelacji wielorakiej, natomiast R 
jest macierza korelacji dla zmiennych objasniajacych. W metodzie tej za 
zmienne optymalne przyjmuje sie taka kombinacje zmiennych objasniaja- 
cych wybraną ze zbioru potencjalnych zmiennych objaśniających, dla któ- 
rej współczynnik G przyjmuje wartość maksymalną. Zmienne wybrane do 
modelu według tej metody są słabo skorelowane między sobą oraz silnie 
skorelowane ze zmienną endogeniczną. 

W niniejszej pracy uogólnimy metodę B. Guzika na liniowy model 
wielorównaniowy postaci 


YB+XA+E=0, 


gdzie Yırm — macierz obserwacji dokonanych na zmiennej endogenicznej, 
Xtzm — macierz obserwacji dokonanych na zmiennych z gory ustalonych, 
B = [Bijlmom — macierz parametrów strukturalnych związanych ze zmienną 
endogeniczną, A = [a;;]krm — macierz paramterów strukturalnych związa- 
nych ze zmiennymi z góry ustalonymi, E = [e;;]t2m — macierz składników 
losowych, t — liczba obserwacji, m — liczba zmiennych endogenicznych, k 
— liczba zmiennych z góry ustalonych. l 

Będziemy rozważać trzy następujące przypadki: 

1) macierz B jest określona (tzn. jeżeli wiadomo dla jakich par (7,7) i,j = 
1,2,..., m Bi; = 0 oraz macierz A nie jest określona, 

2) macierz B nie jest określona i macierz A jest określona, 

3) macierz B nie jest określona i macierz A nie jest określona. 

Przypadek pierwszy ma miejsce wtedy, gdy teoria ekonomii wyznacza 
współzależność pomiędzy zmiennymi endogenicznymi, czyli gdy dla każdej 
zmiennej endogenicznej y wyznaczony jest zbiór Y, zmiennych endogenicz- 
nych opisujących zmienną y. Niech A będzie zbiorem potencjalnych zmien- 
nych z góry ustalonych. W tym przypadku dla każdej zmiennej y wybieramy 
podzbiór Y, zawarty w A’ taki, że równanie, w którym zmienną y opisują 
zmienne ze zbioru Y, i Vy jest identyfikowane o maksymalnym zmodyfiko- 
wynym współczynniku determinacji. Z kolei jeżeli macierz A jest określona, 
tzn. jest wyznaczony zbiór X, C A, którego elementy opisują zmienną y 
oraz macierz B nie jest określona, to dla każdej zmiennej endogenicznej y 
wybieramy zbiór Y, taki, że równanie, w którym zmienną y opisują zmienne 
ze zbioru Y, i zmienne ze zbioru Ay, ma największy zmodyfikowany współ- 
czynnik determinacji wśród równań identyfikowalnych. W przypadku gdy 
macierze A i B nie są określone, to dla każdej zmiennej ednogenicznej y 
wybieramy dwa podzbiory Ay i Y, zawarte odpowiednio w zbiorach X i Y 
takie, by równanie, w którym zmienną y opisują zmienne ze zbiorów 4, i Y, 
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bylo identyfikowalne o maksymalnym zmodyfikowanym wspölczynniku de- 
terminacji. Identyfikowalność sprawdzamy warunkiem koniecznym wymia- 
rów, tzn. badamy czy liczba elementów zbioru A — X, jest większa lub równa 
od liczby elementów zbioru yy. | 


czy (Y — Xj) > ty 


obliczamy Gy( Vy, Xj) 


czy Gy(Vy, X;) jest większe 
od wcześniej obliczonych 
wartości tego współczynnika 


Ryc. 1. Algorytm doboru zmiennych, gdy macierz B jest określona oraz macierz A nie 
jest określona 
Algorythm of choice of variables, when matrix B is determined and matrix A is not 


Poniżej przedstawimy algorytmy doboru zmiennych w każdym wymie- 
nionym wyżej przypadku. Niech G,();,A;) oznacza zmodyfikowany współ- 
czynnik determinacji obliczony dla modelu, w którym zmienną y objaśniają 
zmienne z i-tego podzbioru zbioru Y oraz z j-tego podzbioru A, gdzie 
i=1,2,..., 2™, j = 1,2,...,2F. W przypadku pierwszym, gdy macierz B 
jest określona oraz macierz A nie jest określona algorytm doboru zmiennych 
polega na tym, że ze zbioru S wszystkich podzbiorów zbioru A” wybieramy 
podzbiór $,, którego elementami są podzbiory A; € Y takie, że równanie 
objaśniające zmienną y przy pomocy zmiennych ze zbiorów Y, i A, jest 
identyfikowalne. Następnie ze zbioru Sọ wybieramy zbiór Aj, spełniający 
warunek: 


Gy(Vy, Ajo) = max{Gy(Vy, 4) : Y € So} 


i przyjmujemy, ze Ay = Ajo. Aby okreslié macierz A trzeba zastosowaé 
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algorytm dla kazdej zmiennej endogenicznej y € Y. Przedstawiony algorytm 
zilustrujemy przy pomocy schematu blokowego (ryc. 1). 

Jeżeli macierz B nie jest określona oraz macierz A jest określona, to 
algorytm doboru zmiennych polega na tym, ze ze zbioru T wszystkich 
podzbiorów zbioru Y wybieramy podzbiór T, tych zbiorów Y; € Y dla 
których y¢); i równanie objaśniające zmienną y przy pomocy zmiennych ze 
zbioru Y; oraz Y, jest identyfikowalne. Następnie ze zbioru T, wybieramy 
podzbiór Vio taki, że 


Gy(3io, Vy) = max{G,( Yj, Vy) : Y; € To) 


i przyjmujemy, ze Y, = Yio. Algorytm ten stosujemy oddzielnie dla każdej 
zmiennej endogenicznej y € Y. Schemat blokowy dla powyższego przypadku 
jest następujący 


czy Gy(Vi, Vy) jest większe 
od wcześniej obliczonych 


wartości tego współczynnika 


Ryc. 2. Algorytm doboru zmiennych, gdy macierz B nie jest określona oraz macierz A 
jest określona 
Algorythm of choice of variables, when matrix B is not determined and matrix A is 


W przypadku gdy macierze A i B nie są określone, to ze zbioru U 
określonego w następujący sposób 


UI): Vi C Y, Yi #0, 4j CA, i=1,2,...,27-1;j = boss] 
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wybieramy podzbiór U, tych par, dla których: 

a) y Yi 

b) równanie, w którym zmienną y opisują zmienne ze zbiorów ); i X; jest 
identyfikowalne. 

Następnie dla każdego elementu ();, X;) ze zbioru U, obliczamy zmodyfiko- 
wany wspólczynnik determinacji G,(0);, X;) oraz wyznaczamy 


Gy(Vio, Vjo) = max{Gy(Vi, 4) : (Vi, Xj) € Uo}. 


W algorytmie tym za Y, i Vy przyjmujemy odpowiednio zbiory Yio i Año. 
Aby określić macierze Ai B, należy ten algorytm zastosować oddzielnie dla 
każdej zmiennej endogenicznej y € Y. 
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SUMMARY 


The paper presents a model of choosing the variables for the econometric model 
making use of a modified coefficient of determination. The suggested method considers 
different cases depending on whether there are determined matrixes of structural parame- 
ters connected with the variables established in advance and with endogenic variable or 
whether there are not any. 
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